Introducción al periodismo de datos

Israel Zúñiga de la Mora. Chief Data Officer @ ZapopanLab

Campus Party MX - 22/Julio/2015

Guadalajara, Jal.

ZapopanLab

Laboratorio de innovación cívica fomentando colaboración, datos e ideas abiertas en la ciudad de Zapopan y GDL. Acercamientos de ciencia, tecnología y sociedad.

Israel Zúñiga de la Mora

  • Nerd since '89
  • Ingeniero en Telematica
  • Hacker en el gobierno

Programa

  • Periodismo de datos
  • Datos Abiertos
    • 5 star Open Data
  • Herramientas para datos
  • Como hacer periodismo de datos:
    • Compila
    • Limpia
    • Combina
    • Contextualiza
    • Comunica
  • Datos en CPMX
  • Conclusiones
  • Estrategia en conjunto: Funcionarios, Periodistas, Academia

Datos Abiertos

5 star Open Data

Herramientas para datos

Hoja de Calculo

  • LibreOffice
  • Microsoft Office
  • Google Docs

Limpieza

  • OpenRefine

...para Hackers

  • R + RStudio
  • Python + Jupyter
  • SOFA (Statistics Open For All)
  • D3.js
  • MathLab
  • IBM SPSS
  • SAS Analytics

Big Data

  • Hadoop (MapReduce y YARN)
  • Spark
  • Storm
  • Kafka
  • SAP Hana

Visualizacion / Interactividad

  • D3.js
  • Tableau

Método científico

  1. Observación
  2. Inducción
  3. Hipótesis
  4. Experimentación
  5. Validación
  6. Generación de teoría(s)

Periodismo de datos

¿Por qué los periodistas deberían usar datos?

Compila: Obtener Datos

  • Reportes
  • Sitios web (Scrapping)
  • Portales de Open Data y repositorios -->> http://datos.gob.mx
  • Solicitudes de transparencia
  • APIs (Application Programming Interface) y Bases de Datos

Limpia: Armonización y Normalización

  1. Detección de errores
  2. Correción

OpenRefine.Org

Demo

Combina

Funciones estadísticas (Sumatorias, promedios, porcentajes)

Correlación de variables (tablas dinámicas)

Visualizaciones (clusters)

Contextualiza: Historias basadas en datos

Soporte en visualizaciones

Narrativas

Aplicaciones

Comunica: Difusión

1. Acceso a código fuente (Github, Authorea) y publicacion de datasets (Github, CKAN, SOCRATA)

2. Plataformas (Authorea, Github Pages, Blogs, Wordpress, Jupyter Notebooks)

3. Aplicaciones basadas en datos NY Times Upshot, 538, etc

Conclusiones

Cualquier persona puede analizar datos

Nuevos enfoques para el periodismo

Actualización de nuestras capacidades

El periodismo de datos es el futuro

Estrategia en conjunto: Funcionarios, Periodistas, Academia

Gracias

Israel Z. Twitter: @0xD1 // hola@israelzuniga.com // http://israelzuniga.com ZapopanLab: Tw/Fb: @ZapopanLab